(網(wǎng)經(jīng)社訊)最近看到黃奇帆教授在第三屆外灘金融峰會上關于數(shù)據(jù)治理的發(fā)言,系統(tǒng)地論述了其對數(shù)據(jù)權利和數(shù)據(jù)交易有關規(guī)則的思考,很受啟發(fā)。雖然我并不認同黃教授的大部分觀點,但也不得不佩服黃教授作為一個非法律專業(yè)人士對數(shù)據(jù)治理這一全新領域的系統(tǒng)性思考。同時這事也促使我盡快拋出自己對數(shù)據(jù)治理法律問題的解決方案,供大家討論。
之所以我將這篇文章命名為“基本邏輯”,就是覺得在這一全新領域,很多最底層的概念和原理還沒有分析清楚或者達成基本的共識,而這些會構成我們討論數(shù)據(jù)權利、數(shù)據(jù)交易和權利歸屬的前提。這些概念和原則至少應該包括:
數(shù)據(jù)治理的概念、數(shù)據(jù)的概念、數(shù)據(jù)的基本特性,等等。
首先,關于數(shù)據(jù)治理的概念,可以有兩種,黃教授的文章里所說的數(shù)據(jù)治理,指的大概是第一種,即治理數(shù)據(jù)和治理數(shù)據(jù)產(chǎn)業(yè)。包括數(shù)據(jù)立法和數(shù)據(jù)產(chǎn)業(yè)立法等,《個人信息保護法》、《數(shù)據(jù)安全法》等都在這一層次里,我個人也傾向于把數(shù)據(jù)治理限定在這一層次討論。
另一種概念則是利用數(shù)據(jù)實施治理,這個范圍就很廣了,可以理解為治理的數(shù)據(jù)化和信息化,是治理現(xiàn)代化的核心或重要組成部分。這里即包含對數(shù)字經(jīng)濟和社會的治理,也包括對實體經(jīng)濟和社會的治理。
其次,關于數(shù)據(jù)的概念,又可以有三種,第一種過于大,第二種過于小,第三種比較合適,但也有一定的局限性。
第一種,廣義的數(shù)據(jù)基本等同于信息,泛指所有的信息或資料,在這一層次,你也可以把個人數(shù)據(jù)和個人信息劃等號。
比如,在百度詞條中有這樣的描述:大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。也就是說,這里所引用的數(shù)據(jù)的概念,基本就是等同于信息和資訊的。
第二種,狹義的數(shù)據(jù)專指數(shù)字類信息,也就是我們對數(shù)據(jù)這一概念最本能和原始的反應。
《漢語大辭典》中對數(shù)據(jù)的定義是:數(shù)據(jù)shùjù〖data〗:科學實驗、檢驗、統(tǒng)計等所獲得的和用于科學研究、技術設計、查證、決策等的數(shù)值。相比于數(shù)字類信息,由于限定了使用范疇,顯然這一定義的范圍更狹窄。
第三種,指的是數(shù)字化的信息,即網(wǎng)絡空間以二進制代碼存在的所有信息,即這一層次的數(shù)據(jù)概念等同于網(wǎng)絡信息。
在計算機科學中,數(shù)據(jù)的定義是指所有能輸入到計算機并被計算機程序處理的符號的介質(zhì)的總稱,是用于輸入電子計算機進行處理,具有一定意義的數(shù)字、字母、符號和模擬量等的統(tǒng)稱。
我國《數(shù)據(jù)安全法》中的定義,基本也是這個意思。其第三條明確規(guī)定:“本法所稱數(shù)據(jù),是指任何以電子或者其他方式對信息的記錄。”
按照這一定義,我國的《數(shù)據(jù)安全法》可以理解為專門針對線上的,不能囊括線下數(shù)據(jù)安全。你也可以把它理解為“網(wǎng)絡數(shù)據(jù)安全法”。
最后,順便提一下大數(shù)據(jù)的概念,因為很多的政策文件,包括《數(shù)據(jù)安全法》里都引用了。在我的定義里,其實大數(shù)據(jù)更接近于一種全新的方法論,而不在于數(shù)據(jù)本身,只有順著這個思路才可能正確理解大數(shù)據(jù)。即大數(shù)據(jù)等于“全數(shù)據(jù)+笨辦法”。當然,這是阿拉木斯版的定義。
而在維基百科中,對大數(shù)據(jù)的定義是:在信息技術中,大數(shù)據(jù)是指一些使用目前數(shù)據(jù)庫管理工具或傳統(tǒng)數(shù)據(jù)處理應用很難處理的大型而復雜的數(shù)據(jù)集。在維克托·邁爾-舍恩伯格編寫的《大數(shù)據(jù)時代》 中,大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進行分析處理。
關于數(shù)據(jù)的基本特性,也就是本文的主體部分。
在分析這部分時我們需要說明兩個大的前提:第一個就是涉及國家安全的數(shù)據(jù)問題的除外,我們本文里只討論民商事和行政管理領域與數(shù)據(jù)有關的問題;第二個前提是線上線下一體化原則,雖然很多問題是從線上出發(fā)的,但我們盡量囊括線下的各種應用場景,避免造就線下數(shù)據(jù)法律問題討論的盲區(qū)。
簡單地說,我認為,討論數(shù)據(jù)權利、權利歸屬等所有問題,都應該從論證清楚數(shù)據(jù)的基本特性出發(fā),才有意義,才可能站得住腳。數(shù)據(jù)的基本特性就是數(shù)據(jù)的“三性”,我概括為:細碎和附隨性、生成復雜性、功能多樣性。
提到三性,了解知識產(chǎn)權法律的人士會非常熟悉,我國著作權法中規(guī)定的著作權的三個基本特性是:獨創(chuàng)性、可復制性、合法性。而我國專利法中對專利權三個基本特性的定義則是:新穎性、創(chuàng)造性和實用性。我們可以毫不夸張地說,我國法律中著作權和專利權的相關權利和規(guī)則都是在這兩個“三性”的基礎上搭建的。
關于細碎和附隨性。數(shù)據(jù)的細碎性是顯而易見的,狹義的數(shù)據(jù)是信息的最小單元,就像物理世界里的原子。不管是1、2、3這樣的最簡單的阿拉伯數(shù)字還是0、1這樣的二進制代碼,都是所有信息里最基礎和簡單的元素。但這一特性帶來的法律問題可能是很多人沒有想到的,那就是,我們對這些信息元素的保護水平不可能太高,比如,不應該高于由大量這些元素組成的、門檻更高的知識產(chǎn)權。因為如果我們對數(shù)據(jù)的保護水平高于知識產(chǎn)權,就會影響知識產(chǎn)權的申請和保護,所有人都會算這個帳:既然我只要利用沒有任何門檻的數(shù)據(jù)保護機制就可以享受更高的保護,我還干嘛費那么大的勁去申請專利、商標、著作權呢?
概括一下,就是在法律這門科學里,我們不僅要考慮各種權益的保護問題,更要從更高更全面的角度研究保護與保護之間可能的各種沖突,這樣才可能建立真正有效且多贏的制度機制。
由于細碎和附隨這兩個特點關聯(lián)性很強,我就把它們放在了一起,作為一個特征描述。所謂附隨,當然不是絕對的,但絕大多數(shù)數(shù)據(jù)基本都是附隨某一個活動產(chǎn)生的,比如我們的交易數(shù)據(jù)、醫(yī)療數(shù)據(jù)、健身數(shù)據(jù)、聊天數(shù)據(jù)、共享單車騎行數(shù)據(jù),等等。我們從事這些活動,目的不是為了獲得這些林林總總、如影隨形的數(shù)據(jù),而是要實現(xiàn)交易、治療、健身、溝通和出行,數(shù)據(jù)的生成只是副產(chǎn)品。
既然邏輯是這樣,那就不能喧賓奪主。我們很可能愿意為了得到更好的交易、治療和健身、溝通、出行的服務而讓渡使用和分析我們數(shù)據(jù)的權利,這個要尊重個人的意愿和選擇,而不可以因為有高大上的法律在上而本末倒置,這樣的本末倒置只會讓我們的數(shù)字經(jīng)濟和服務倒退。
關于生成復雜性。
即數(shù)據(jù)的生成是多樣化的,我們個人創(chuàng)造的數(shù)據(jù)當然是最清晰明確的,比如我們的姓名、我們的微信名和頭像等,但問題是絕大多數(shù)數(shù)據(jù)都不是這樣,比如我們的身份證號碼、銀行賬號,是系統(tǒng)生成的,交易記錄雖然是我們貢獻的,但也是基于系統(tǒng)設定生成的,駕駛記錄、信用記錄等則也是基于我們的行為和系統(tǒng)設置生成的。
在知識產(chǎn)權權利歸屬領域,比如一本張三寫的我的傳記的作品,當然編寫和公開都需要經(jīng)過我的認可,但著作權權利歸屬肯定是張三而不是我。這可能成為我們確定數(shù)據(jù)權利歸屬的參考機制之一。
這里我們順帶談一下數(shù)據(jù)交易的問題。即黃奇帆教授提出的,“平臺應該把數(shù)據(jù)交易收益的20%到30%返還給數(shù)據(jù)的生產(chǎn)者”的問題。且不說這個數(shù)據(jù)生產(chǎn)者到底是誰,我們都知道,在我們現(xiàn)在的法律環(huán)境下,交易原始數(shù)據(jù)的法律風險極高,正規(guī)的企業(yè)應該不會去做這樣的事情,交易的一般都是衍生數(shù)據(jù)或分析數(shù)據(jù)等,一旦衍生數(shù)據(jù)成為匿名化數(shù)據(jù),就脫離了我國《個人信息保護法》治理的范疇,所以這種返還的提法是有違行業(yè)常識的。
隨著《個人信息保護法》、《數(shù)據(jù)安全法》的出臺和實施,加上之前的《網(wǎng)絡安全法》,我們對數(shù)據(jù)保護的水平應該是很高的,在國際范圍內(nèi)基本是這樣。這些法律都要求數(shù)據(jù)收集、加工、處理、轉(zhuǎn)移和超范圍使用等獨立地告知用戶且獲得用戶同意,這樣可能會帶來一個新的問題是,用戶會被一個商家不斷地告知是否同意,不厭其煩,反而成了一種新的騷擾。權益的保護可能確實是好事,但好事也有度,法律追求的應該是恰當?shù)谋Wo,保護的平衡,而不是極致的保護,極致的保護只會適得其反。
最近我就發(fā)現(xiàn),在那些以前上過的網(wǎng)頁再次填寫輸入過的數(shù)據(jù)時,以前自動顯示曾經(jīng)輸入內(nèi)容的變得少了,不得不使用一次就重復輸入一次。信息被記錄的次數(shù)少了,安全性可能是提高了,但便捷性卻大幅下降了。
關于功能多樣性。
就拿數(shù)據(jù)中的個人數(shù)據(jù)而言,通過多年的觀察,我把個人數(shù)據(jù)分為五類:個人特征數(shù)據(jù)、個人記錄數(shù)據(jù)、復合型數(shù)據(jù)、個人生物特征數(shù)據(jù)、功能型個人數(shù)據(jù)。每一類數(shù)據(jù)其中蘊含的權利、權利的歸屬和保護的模式可能會有很大的差別,如果簡單套用統(tǒng)一的的模式和規(guī)定,反而會出問題。
第一類說是個人數(shù)據(jù),其實是指向個人的數(shù)據(jù),個人不一定擁有對這個數(shù)據(jù)的決定權,這個數(shù)據(jù)也基本不是我們本人創(chuàng)造的,我們可以稱其為個人特征數(shù)據(jù)。比如我們的地址、郵箱、電話號碼、身份證信息、銀行賬號、車牌號、信用記錄,等等。這也是我們通常認識上最接近于我們理解的個人數(shù)據(jù)的一類。其實這些個人數(shù)據(jù)都是指向你這個物理的肉身的,但這不等于你擁有法律上對這些信息完全的所有權,包括修改、刪除的權利。法律之所以這么規(guī)定,有的是出于保護其他權益的需要,有的是出于公平合理的需要,有的是出于社會管理的需要。
第二類是我們本人創(chuàng)造的數(shù)據(jù),這類數(shù)據(jù)整體上是偏向于知識產(chǎn)權的,我們可以稱其為個人記錄數(shù)據(jù)。比如我們的聊天記錄,我拍的照片、我寫的文章等。這里面如果夠得上知識產(chǎn)權,如作品等,則與知識產(chǎn)權等權利形成一種競合,如果構不成,則僅僅是作為個人數(shù)據(jù)處理和保護。
第三類是個人使用有關工具創(chuàng)造的數(shù)據(jù),比如騎行共享單車的數(shù)據(jù),開車的各種記錄,使用手機和電腦的記錄,等等,這些信息具有一定的客觀性,與個人特征的關聯(lián)性最小。我們可以稱其為復合型數(shù)據(jù)。
第四類是我們的個人生物特征數(shù)據(jù),這一類是偏向于人身權的。比如我們的肖像、指紋、聲波、虹膜特征、基因排序等;第五類是功能型個人數(shù)據(jù),就是我們設置的密碼、電子簽名等,數(shù)據(jù)本身是沒有意義的,數(shù)據(jù)的存在是為了實現(xiàn)某種特定的功能。
這樣分析下來,其實我們對每一類個人數(shù)據(jù)保護的側重點可能都是不一樣的。對于第一類數(shù)據(jù),個人并沒有什么修改權,法律也不應該支持這種修改,除非存在錯誤;而第二類則完全不同,個人擁有完全的修改權,就像我們的微信頭像,我們想換就可以換。對于最后一類數(shù)據(jù),我們的密碼等,保護的重點應該是不被披露和關聯(lián),而且應該是強保護;而對于生物特征數(shù)據(jù),比如我們的臉部特征等,由于我們每天都在進行自我披露,所以保護的重點則是不被非法收集和濫用。
最后,我們說,不管是什么樣的權利,簡單地談保護往往是沒有意義的,關鍵點和難點在于權利和義務的平衡、權利和權利之間的平衡、保護的度的恰到好處的把握,過猶不及。作為一種十分特殊的,完全脫離我們以前基于實物世界權利認知的,存在于虛擬空間的數(shù)據(jù),在這方面就更加特殊。一定不能將你在物理世界里對你的茶杯和現(xiàn)金擁有的所有權的認知簡單地搬到這里來,這也是黃教授的理論出現(xiàn)錯誤的根本原因。
就像我們無法將我們個人數(shù)據(jù)之一的銀行存款隨意加一個零,不能隨意刪除我們的交通違章記錄一樣,那些趁《個人信息保護法》實施之際鼓吹什么”我的信息我做主”的說法,我只想對他說:“你想多了”。